2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

Update: 2025-11-26

Description

本期的 15 篇论文如下：

[00:17 ] 🧬 GigaEvo: An Open Source Optimization Framework Powered By LLMs And Evolution Algorithms（GigaEvo：基于大语言模型与进化算法的开源优化框架）

[00:57 ] 🔬 MedSAM3: Delving into Segment Anything with Medical Concepts（MedSAM3：深入探索基于医学概念的通用分割模型）

[01:34 ] 🔍 Agent0-VL: Exploring Self-Evolving Agent for Tool-Integrated Vision-Language Reasoning（Agent0-VL：探索工具集成视觉语言推理的自进化智能体）

[02:03 ] 🎨 iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation（iMontage：统一、通用、高度动态的多对多图像生成）

[02:38 ] 🕺 SteadyDancer: Harmonized and Coherent Human Image Animation with First-Frame Preservation（SteadyDancer：基于首帧保持的协调连贯人体图像动画）

[03:18 ] 🔍 Does Understanding Inform Generation in Unified Multimodal Models? From Analysis to Path Forward（理解是否真正指导统一多模态模型的生成？从分析到前进路径）

[04:04 ] 🤖 GigaWorld-0: World Models as Data Engine to Empower Embodied AI（GigaWorld-0：世界模型作为数据引擎赋能具身AI）

[04:44 ] 🎯 Soft Adaptive Policy Optimization（软自适应策略优化）

[05:14 ] 🎬 UltraViCo: Breaking Extrapolation Limits in Video Diffusion Transformers（UltraViCo：突破视频扩散变换器的外推极限）

[05:55 ] 🎯 SSA: Sparse Sparse Attention by Aligning Full and Sparse Attention Outputs in Feature Space（SSA：通过特征空间中对齐全注意力和稀疏注意力输出的稀疏稀疏注意力）

[06:51 ] 🎨 OmniAlpha: A Sequence-to-Sequence Framework for Unified Multi-Task RGBA Generation（OmniAlpha：面向统一多任务RGBA生成的序列到序列框架）

[07:41 ] 🎬 ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding（ReDirector：使用旋转相机编码创建任意长度视频重拍）

[08:13 ] 🖼 VQ-VA World: Towards High-Quality Visual Question-Visual Answering（VQ-VA世界：迈向高质量视觉问题-视觉回答）

[09:06 ] 🔍 HunyuanOCR Technical Report（幻方OCR技术报告）

[09:48 ] 🏙 MajutsuCity: Language-driven Aesthetic-adaptive City Generation with Controllable 3D Assets and Layouts（MajutsuCity：语言驱动美学自适应城市生成与可控3D资产及布局）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

2025.12.01 | Z-Image小参高效夺冠；REASONEDIT先思后画登顶

2025-12-0109:33

【周末特辑】11月第5周最火AI论文 | 自适应正交稳训练；GAM代理即搜忆

2025-11-2911:54

2025.11.28 | 潜在奖励模型提速降显存；画布多模态生成碾压SOTA

2025-11-2804:47

2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

2025-11-2711:03

2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

2025-11-2611:05

2025.11.25 | 即时编译让记忆无损；AutoEnv自动挑环境提两成

2025-11-2510:01

2025.11.24 | 开源7B模型刷新多模态推理；GeoVista小模型精准地理定位

2025-11-2410:42

【周末特辑】11月第4周最火AI论文 | Kandinsky 5.0开源全家桶；MiroThinker开源智能体

2025-11-2210:19

2025.11.21 | V-ReasonBench考视频模型推理；Step-Audio-R1让语音越“想”越强

2025-11-2109:54

2025.11.20 | 视频模型拍推理链，迷宫百发百中；无标注左右互搏，视觉模型自学跃升

2025-11-2003:36

2025.11.19 | 像素演员难推理；视觉误导测真章

2025-11-1908:19

2025.11.18 | RL奥赛夺金；Uni-MoE 2.0全能跃升

2025-11-1810:08

2025.11.17 | RoPE去噪救长文本；AI速筛离子液体

2025-11-1710:06

【周末特辑】11月第3周最火AI论文 | 3D游戏智能体开源方案；桌面AI少样本精准操控

2025-11-1511:34

2025.11.14 | UniVA四合一开源视频通才；Depth Anything 3单ViT通吃3D

2025-11-1403:25

2025.11.13 | 原神数据炼成7B通用AI；零训练轨迹秒变视频遥控器

2025-11-1306:28

2025.11.12 | 1.5B小模型反超671B大模型；多智能体质检聊天机器人

2025-11-1206:56

2025.11.11 | 小窗口勤总结刷新深度研究；先广撒网再啃难题激活代码竞赛

2025-11-1109:58

2025.11.10 | DeepEyesV2小模型边看图边写代码；纯数据让AI长出立体眼

2025-11-1005:30

【周末特辑】11月第2周最火AI论文 | 视频生成即推理；SVG草图变代码

2025-11-0812:07

00:00

2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

#box-pro-ellipsis-176467867386732{-webkit-line-clamp:2;}2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割